9 resultados para Bioinformática

em Repositório Institucional da Universidade de Aveiro - Portugal


Relevância:

10.00% 10.00%

Publicador:

Resumo:

O projecto de sequenciação do genoma humano veio abrir caminho para o surgimento de novas áreas transdisciplinares de investigação, como a biologia computacional, a bioinformática e a bioestatística. Um dos resultados emergentes desde advento foi a tecnologia de DNA microarrays, que permite o estudo do perfil da expressão de milhares de genes, quando sujeitos a perturbações externas. Apesar de ser uma tecnologia relativamente consolidada, continua a apresentar um conjunto vasto de desafios, nomeadamente do ponto de vista computacional e dos sistemas de informação. São exemplos a optimização dos procedimentos de tratamento de dados bem como o desenvolvimento de metodologias de interpretação semi-automática dos resultados. O principal objectivo deste trabalho consistiu em explorar novas soluções técnicas para agilizar os procedimentos de armazenamento, partilha e análise de dados de experiências de microarrays. Com esta finalidade, realizou-se uma análise de requisitos associados às principais etapas da execução de uma experiência, tendo sido identificados os principais défices, propostas estratégias de melhoramento e apresentadas novas soluções. Ao nível da gestão de dados laboratoriais, é proposto um LIMS (Laboratory Information Management System) que possibilita a gestão de todos os dados gerados e dos procedimentos realizados. Este sistema integra ainda uma solução que permite a partilha de experiências, de forma a promover a participação colaborativa de vários investigadores num mesmo projecto, mesmo usando LIMS distintos. No contexto da análise de dados, é apresentado um modelo que facilita a integração de algoritmos de processamento e de análise de experiências no sistema desenvolvido. Por fim, é proposta uma solução para facilitar a interpretação biológica de um conjunto de genes diferencialmente expressos, através de ferramentas que integram informação existente em diversas bases de dados biomédicas.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O desenvolvimento de equipamentos de descodificação massiva de genomas veio aumentar de uma forma brutal os dados disponíveis. No entanto, para desvendarmos informação relevante a partir da análise desses dados é necessário software cada vez mais específico, orientado para determinadas tarefas que auxiliem o investigador a obter conclusões o mais rápido possível. É nesse campo que a bioinformática surge, como aliado fundamental da biologia, uma vez que tira partido de métodos e infra-estruturas computacionais para desenvolver algoritmos e aplicações informáticas. Por outro lado, na maior parte das vezes, face a novas questões biológicas é necessário responder com novas soluções específicas, pelo que o desenvolvimento de aplicações se torna um desafio permanente para os engenheiros de software. Foi nesse contexto que surgiram os principais objectivos deste trabalho, centrados na análise de tripletos e de repetições em estruturas primárias de DNA. Para esse efeito, foram propostos novos métodos e novos algoritmos que permitirem o processamento e a obtenção de resultados sobre grandes volumes de dados. Ao nível da análise de tripletos de codões e de aminoácidos foi proposto um sistema concebido para duas vertentes: por um lado o processamento dos dados, por outro a disponibilização na Web dos dados processados, através de um mecanismo visual de composição de consultas. Relativamente à análise de repetições, foi proposto e desenvolvido um sistema para identificar padrões de nucleótidos e aminoácidos repetidos em sequências específicas, com particular aplicação em genes ortólogos. As soluções propostas foram posteriormente validadas através de casos de estudo que atestam a mais-valia do trabalho desenvolvido.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A glicosilação não-enzimática e o stress oxidativo representam dois processos importantes visto desempenharem um papel importante no que respeita às complicações de vários processos patofisiológicos. No presente, a associação entre a glicosilação não-enzimática e a oxidação de proteínas é reconhecida como sendo um dos principais responsáveis pela acumulação de proteínas não-funcionais que, por sua vez, promove uma contínua sensibilização para um aumento do stress oxidativo ao nível celular. Embora esteja disponível bastante informação no que respeita aos dois processos e suas consequências ao nível estrutural e funcional, permanecem questões por esclarecer acerca do que se desenvolve ao nível molecular. Com o objectivo de contribuir para uma melhor compreensão da relação entre a glicosilação não-enzimática e a oxidação, proteínas modelo (albumina, insulina e histonas H2B e H1) foram submetidas a sistemas in vitro de glicosilação não-enzimática e oxidação em condições controladas e durante um período de tempo específico. A identificação dos locais de glicosilação e oxidação foi realizada através de uma abordagem proteómica, na qual após digestão enzimática se procedeu à análise por cromatografia líquida acoplada a espectrometria de massa tandem (MALDI-TOF/TOF). Esta abordagem permitiu a obtenção de elevadas taxas de cobertura das sequências proteicas, permitindo a identificação dos locais preferenciais de glicosilação e oxidação nas diferentes proteínas estudadas. Como esperado, os resíduos de lisina foram os preferencialmente glicosilados. No que respeita à oxidação, além das modificações envolvendo hidroxilações e adições de oxigénio, foram identificadas deamidações, carbamilações e conversões oxidativas específicas de vários aminoácidos. No geral, os resíduos mais afectados pela oxidação foram os resíduos de cisteína, metionina, triptofano, tirosina, prolina, lisina e fenilalanina. Ao longo do período de tempo estudado, os resultados indicaram que a oxidação teve início em zonas expostas da proteína e/ou localizadas na vizinhança de resíduos de cisteína e metionina, ao invés de exibir um comportamente aleatório, ocorrendo de uma forma nãolinear por sua vez dependente da estabilidade conformacional da proteína. O estudo ao longo do tempo mostrou igualmente que, no caso das proteínas préglicosiladas, a oxidação das mesmas ocorreu de forma mais rápida e acentuada, sugerindo que as alterações estruturais induzidas pela glicosilação promovem um estado pro-oxidativo. No caso das proteínas pré-glicosiladas e oxidadas, foi identificado um maior número de modificações oxidativas assim como de resíduos modificados na vizinhança de resíduos glicosilados. Com esta abordagem é realizada uma importante contribuição na investigação das consequências do dano ‘glico-oxidativo’ em proteínas ao nível molecular através da combinação da espectrometria de massa e da bioinformática.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A fosforilação reversível de proteínas é um importante mecanismo de controlo em eucariotas. A fosfoproteína fosfatase 1 (PPP1) é uma fosfatase de serina/treonina envolvida em vários processos celulares. Existem três isoformas da subunidade catalítica (α/CA, δ/β/CB e γ/CC) com pequenas diferenças nos terminais amino e carboxílico. O gene PPP1CC sofre ainda splicing alternativo para produzir duas isoformas, a PPP1CC1 ubíqua e a PPP1CC2 enriquecida em testículo e específica de esperma. A localização e especificidade de substratos da PPP1 está dependente da formação de complexos oligoméricos com proteínas que interagem com a PPP1 (PIPs). O objetivo principal desta tese foi estudar novas PIPs, específicas de testículo e esperma, a fim de melhor caracterizar o papel desta fosfatase e dos respetivos complexos na reprodução em mamíferos. Com este fim, estudou-se a presença, localização e possíveis funções de uma PIP previamente conhecida, PPP1R2, e de duas novas PIPs, PPP1R2P3 e Tctex1d4. PPP1R2 e PPP1R2P3 estão presentes em esperma humano colocalizando com a PPP1CC2, na cabeça e na cauda. A hipótese é que as holoenzimas localizadas na cabeça terão um papel na reação acrossómica, enquanto que as holoenzimas presentes no axonema são relevantes para o controlo da motilidade flagelar. De seguida foram estudados os pseudogenes da PPP1R2, em termos de história evolutiva e de possíveis funções. Na espécie humana, a PPP1R2 tem 10 pseudogenes, 7 deles específicos de primatas. Estudos de bioinformática e dados de expressão mostram que os PPP1R2P1/P3/P9 são os pseudogenes com maior probabilidade de serem transcritos e traduzidos. Também identificámos o PPP1R2P9 em esperma humano e mostrámos que alguns pseudogenes poderão estar associados a estados fisiopatológicos. Isto indica que o processo de evolução poderá estar ligado á formação de novos genes ou ao controlo do mRNA da PPP1R2. A sobre-expressão da PPP1R2 ou PPP1R2P3 em testículo de ratinho também foi realizada, para caracterizar os mecanismos envolvidas na função dos complexos PPP1R2/PPP1R2P3-PPP1CC2 na espermatogénese e fisiologia dos espermatozoides. A dineína de cadeia leve, Tctex1d4, foi encontrada como interagindo com a PPP1C e como estando presente em testículo de ratinho e em esperma humano. Demonstrámos que a Tctex1d4 e a PPP1 colocalizam no centro organizador de microtúbulos e nos microtúbulos e que o motivo de ligação à PPP1 presente na Tctex1d4 parece ser importante para manter a PPP1 no centro organizador de microtúbulos e/ou para disromper ou atrasar o seu movimento ao longo dos microtúbulos emergentes. Estes resultados abrem novos caminhos para os possíveis papéis do complexo Tctex1d4-PPP1 na dinâmica dos microtúbulos, motilidade do esperma, reação acrossómica e na regulação da barreira hemato-testicular, provavelmente, através da via de sinalização do TGFß. A análise do motivo de ligação à PPP1 mostra que este é altamente conservado entre os mamíferos, com exceção das Pikas, sugerindo que esta perda aconteceu antes da radiação das Pikas, há 6-20 milhões de anos atrás. Através de um rastreio por mutações demonstrámos que a capacidade da Tctex1d4 se ligar à PPP1 é mantida nas Pikas, embora o motivo de ligação à PPP1 esteja disrompido. Este estudo abre portas para novas descobertas na área da reprodução mostrando o papel da PPP1CC2 na espermatogénese e fisiologia do esperma.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A exigente inovação na área das aplicações biomédicas tem guiado a evolução das tecnologias de informação nas últimas décadas. Os desafios associados a uma gestão, integração, análise e interpretação eficientes dos dados provenientes das mais modernas tecnologias de hardware e software requerem um esforço concertado. Desde hardware para sequenciação de genes a registos electrónicos de paciente, passando por pesquisa de fármacos, a possibilidade de explorar com precisão os dados destes ambientes é vital para a compreensão da saúde humana. Esta tese engloba a discussão e o desenvolvimento de melhores estratégias informáticas para ultrapassar estes desafios, principalmente no contexto da composição de serviços, incluindo técnicas flexíveis de integração de dados, como warehousing ou federação, e técnicas avançadas de interoperabilidade, como serviços web ou LinkedData. A composição de serviços é apresentada como um ideal genérico, direcionado para a integração de dados e para a interoperabilidade de software. Relativamente a esta última, esta investigação debruçou-se sobre o campo da farmacovigilância, no contexto do projeto Europeu EU-ADR. As contribuições para este projeto, um novo standard de interoperabilidade e um motor de execução de workflows, sustentam a sucesso da EU-ADR Web Platform, uma plataforma para realizar estudos avançados de farmacovigilância. No contexto do projeto Europeu GEN2PHEN, esta investigação visou ultrapassar os desafios associados à integração de dados distribuídos e heterogéneos no campo do varíoma humano. Foi criada uma nova solução, WAVe - Web Analyses of the Variome, que fornece uma coleção rica de dados de variação genética através de uma interface Web inovadora e de uma API avançada. O desenvolvimento destas estratégias evidenciou duas oportunidades claras na área de software biomédico: melhorar o processo de implementação de software através do recurso a técnicas de desenvolvimento rápidas e aperfeiçoar a qualidade e disponibilidade dos dados através da adopção do paradigma de web semântica. A plataforma COEUS atravessa as fronteiras de integração e interoperabilidade, fornecendo metodologias para a aquisição e tradução flexíveis de dados, bem como uma camada de serviços interoperáveis para explorar semanticamente os dados agregados. Combinando as técnicas de desenvolvimento rápidas com a riqueza da perspectiva "Semantic Web in a box", a plataforma COEUS é uma aproximação pioneira, permitindo o desenvolvimento da próxima geração de aplicações biomédicas.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

The rapid evolution and proliferation of a world-wide computerized network, the Internet, resulted in an overwhelming and constantly growing amount of publicly available data and information, a fact that was also verified in biomedicine. However, the lack of structure of textual data inhibits its direct processing by computational solutions. Information extraction is the task of text mining that intends to automatically collect information from unstructured text data sources. The goal of the work described in this thesis was to build innovative solutions for biomedical information extraction from scientific literature, through the development of simple software artifacts for developers and biocurators, delivering more accurate, usable and faster results. We started by tackling named entity recognition - a crucial initial task - with the development of Gimli, a machine-learning-based solution that follows an incremental approach to optimize extracted linguistic characteristics for each concept type. Afterwards, Totum was built to harmonize concept names provided by heterogeneous systems, delivering a robust solution with improved performance results. Such approach takes advantage of heterogenous corpora to deliver cross-corpus harmonization that is not constrained to specific characteristics. Since previous solutions do not provide links to knowledge bases, Neji was built to streamline the development of complex and custom solutions for biomedical concept name recognition and normalization. This was achieved through a modular and flexible framework focused on speed and performance, integrating a large amount of processing modules optimized for the biomedical domain. To offer on-demand heterogenous biomedical concept identification, we developed BeCAS, a web application, service and widget. We also tackled relation mining by developing TrigNER, a machine-learning-based solution for biomedical event trigger recognition, which applies an automatic algorithm to obtain the best linguistic features and model parameters for each event type. Finally, in order to assist biocurators, Egas was developed to support rapid, interactive and real-time collaborative curation of biomedical documents, through manual and automatic in-line annotation of concepts and relations. Overall, the research work presented in this thesis contributed to a more accurate update of current biomedical knowledge bases, towards improved hypothesis generation and knowledge discovery.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

The last decades of the 20th century defined the genetic engineering advent, climaxing in the development of techniques, such as PCR and Sanger sequencing. This, permitted the appearance of new techniques to sequencing whole genomes, identified as next-generation sequencing. One of the many applications of these techniques is the in silico search for new secondary metabolites, synthesized by microorganisms exhibiting antimicrobial properties. The peptide antibiotics compounds can be classified in two classes, according to their biosynthesis, in ribosomal or nonribosomal peptides. Lanthipeptides are the most studied ribosomal peptides and are characterized by the presence of lanthionine and methylanthionine that result from posttranslational modifications. Lanthipeptides are divided in four classes, depending on their biosynthetic machinery. In class I, a LanB enzyme dehydrate serine and threonine residues in the C-terminus precursor peptide. Then, these residues undergo a cyclization step performed by a LanC enzyme, forming the lanthionine rings. The cleavage and the transport of the peptide is achieved by the LanP and LanT enzymes, respectively. Although, in class II only one enzyme, LanM, is responsible for the dehydration and cyclization steps and also only one enzyme performs the cleavage and transport, LanT. Pedobacter sp. NL19 is a Gram-negative bacterium, isolated from sludge of an abandon uranium mine, in Viseu (Portugal). Antibacterial activity in vitro was detected against several Gram-positive and Gram-negative bacteria. Sequencing and in silico analysis of NL19 genome revealed the presence of 21 biosynthetic clusters for secondary metabolites, including nonribosomal and ribosomal peptides biosynthetic clusters. Four lanthipeptides clusters were predicted, comprising the precursor peptides, the modifying enzymes (LanB and LanC), and also a bifunctional LanT. This result revealed the hybrid nature of the clusters, comprising characteristics from two distinct classes, which are poorly described in literature. The phylogenetic analysis of their enzymes showed that they clustered within the bacteroidetes clade. Furthermore, hybrid gene clusters were also found in other species of this phylum, revealing that it is a common characteristic in this group. Finally, the analysis of NL19 colonies by MALDI-TOF MS allowed the identification of a 3180 Da mass that corresponds to the predicted mass of a lanthipeptide encoded in one of the clusters. However, this result is not fully conclusive and further experiments are needed to understand the full potential of the compounds encoded in this type of clusters. In conclusion, it was determined that NL19 strain has the potential to produce diverse secondary metabolites, including lanthipeptides that were not functionally characterized so far.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Fertilization is a multistep and complex process culminating in the merge of gamete membranes, cytoplasmic unity and fusion of genome. CD81 is a tetraspanin protein that participates in sperm-oocyte interaction, being present at the oocyte surface. CD81 has also been implicated in other biological processes, however its specific function and molecular mechanisms of action remain to be elucidated. The interaction between CD81 and its binding partner proteins may underlie the CD81 involvement in a variety of cellular processes and modulate CD81/interactors specific functions. Interestingly, in a Yeast two Hybrid system previously performed in our lab, CD81 has emerged as a putative interactor of the Amyloid Precursor Protein (APP). In the work here described, bioinformatics analyses of CD81 interacting proteins were performed and the retrieved information used to construct a protein-protein interaction network, as well as to perform Gene Ontology enrichment analyses. CD81 expression was further evaluated in CHO, GC-1 and SH-SY5Y cell lines, and in human sperm cells. Additionally, its subcellular localization was analyzed in sperm cells and in the neuronal-like SH-SY5Y cell line. Subsequently, coimmunoprecipitation assays were performed in CHO and SH-SY5Y cells to attempt to prove the physical interaction between CD81 and APP. A functional interaction between these two proteins was accessed thought the analyses of the effects of CD81 overexpression on APP levels. A co-localization analysis of CD81 and some interactors proteins retrieved from the bioinformatics analyses, such as APP, AKT1 and cytoskeleton-related proteins, was also performed in sperm cells and in SH-SY5Y cells. The effects of CD81 in cytoskeleton remodeling was evaluated in SH-SY5Y cells through monitoring the effects of CD81 overexpression in actin and tubulin levels, and analyzing the colocalization between overexpressed CD81 and F-actin. Our results showed that CD81 is expressed in all cell lines tested, and also provided the first evidence of the presence of CD81 in human sperm cells. CD81 immunoreactivity was predominantly detected in the sperm head, including the acrosome membrane, and in the midpiece, where it co-localized with APP, as well as in the post-acrosomal region. Furthermore, CD81 co-localizes with APP in the plasma membrane and in cellular projections in SH-SY5Y cells, where CD81 overexpression has an influence on APP levels, also visible in CHO cells. The analysis of CD81 interacting proteins such as AKT1 and cytoskeletonrelated proteins showed that CD81 is involved in a variety of pathways that may underlie cytoskeleton remodeling events, related to processes such as sperm motility, cell migration and neuritogenesis. These results deepen our understanding on the functions of CD81 and some of its interactors in sperm and neuronal cells.